#Exerccios 4 - Anlises Exploratrias
##Gustavo Agudelo. No. USP: 8893871

setwd("E:/Science/USP/Mestrado Fisiologia Geral_IB-USP/Disciplinas/Primeiro semestre_2014-1/Uso da Linguagem R para Anlise de Dados em Ecologia_2014-1/Exerccios R/Exerccios 4 - Anlises Exploratrias")

#4.1 Rios
data(rivers)
rivers
summary(rivers)
length(rivers)
prop.mm <- sum(rivers < 591.2)/length(rivers)
prop.mm
quantil.75 <- quantile(rivers, 0.75)
quantil.75
medias <- array(list(mean(rivers), mean(rivers, trim=0.25), median(rivers)), dim=3)
medias

#4.2 Cervejas
cervejas <-c("chope","lata","garrafa","chope","garrafa", "garrafa","lata","lata","nenhuma","lata","garrafa","garrafa", "garrafa","lata","lata","lata","garrafa","lata","chope","nenhuma", "garrafa","garrafa","garrafa","chope","garrafa","garrafa","chope","garrafa","lata","lata")
cervejas
barplot(sort(table(cervejas), decreasing=T), xlab="Tipo de cerveja", ylab="Observaes")
dotchart(table(cervejas), ylab="Tipo de cerveja", xlab="Observaes")
#O grfico de pontos (dotchart) tem maior razo dado/tinta do que o grfico de barras, devido que a relao entre os pontos e as categorias fica muito mais clara e direta de interpretar.
#No grfico de barras temos que usar o comprimento das barras para deduzir esta relao.

#4.3 Caixetais
caixeta <- read.table("caixeta.txt", header=T, sep=",", as.is=T)
names(caixeta)
str(caixeta)
head(caixeta)
caixeta$dap <- (caixeta$cap/pi)
hist(caixeta$dap)
hist(caixeta$h[caixeta$local == "chauas"])
hist(caixeta$h[caixeta$local == "jureia"])
hist(caixeta$h[caixeta$local == "retiro"])
table(caixeta$local)
#Ha diferenas, sim. O caixetal chauas apresenta a maior quantidade de rvores amostradas, onde a maioria delas tm entre 50-100 m de altura e muito pocas tm alturas maiores do que 200 m.
#As rvores do caixetal jureia tm uma maior distribuio de tamanhos, com a maior quantidade de rvores medindo por volta de 100 m. Esta distribuio de tamanhos parece muito a uma distribuio normal.
#Por ltimo, as rvores do caixetal retiro tm uma distribuio mais ampla do que as rvores do caixetal chauas. A maioria tm uma altura de 50 m, mas tm um segundo pico por volta dos 100 m.

#4.4 Eucaliptos
e.grandis <- read.table(file="egrandis.txt",header=T,sep=";", as.is=F)
str(e.grandis)
head(e.grandis)
boxplot(e.grandis$dap ~ e.grandis$regiao * e.grandis$rotacao, data = e.grandis)
qqnorm(e.grandis$dap)
qqline(e.grandis$dap)
#Os valores das colas superior e inferior so muito espalhados da linha, o que significa que a varivel dap no tem distribuio normal.

#4.5 Mais Caixetais
#4.5.1
T.cassinoides <- subset(caixeta, caixeta$especie == "Tabebuia cassinoides")
T.cassinoides.chauas <- subset(T.cassinoides, T.cassinoides$local =="chauas")
T.cassinoides.jureia <- subset(T.cassinoides, T.cassinoides$local =="jureia")
T.cassinoides.retiro <- subset(T.cassinoides, T.cassinoides$local =="retiro")
head(T.cassinoides.chauas)

T.cassinoides.chauas$area.basal <- (pi*(T.cassinoides.chauas$dap^2))/4
T.cassinoides.jureia$area.basal <- (pi*(T.cassinoides.jureia$dap^2))/4
T.cassinoides.retiro$area.basal <- (pi*(T.cassinoides.retiro$dap^2))/4

a.b.total.chauas <-  aggregate(T.cassinoides.chauas$area.basal, by=list(T.cassinoides.chauas$arvore), FUN=sum)
a.b.total.jureia <- aggregate(T.cassinoides.jureia$area.basal, by=list(T.cassinoides.jureia$arvore), FUN=sum)
a.b.total.retiro <- aggregate(T.cassinoides.retiro$area.basal, by=list(T.cassinoides.retiro$arvore), FUN=sum)

dap.total.chauas <- 2*(sqrt(a.b.total.chauas/pi))
dap.total.jureia <- 2*(sqrt(a.b.total.jureia/pi))
dap.total.retiro <- 2*(sqrt(a.b.total.retiro/pi))

h.total.chauas <-  aggregate(T.cassinoides.chauas$h, by=list(T.cassinoides.chauas$arvore), FUN=sum)
h.total.jureia <- aggregate(T.cassinoides.jureia$h, by=list(T.cassinoides.jureia$arvore), FUN=sum)
h.total.retiro <- aggregate(T.cassinoides.retiro$h, by=list(T.cassinoides.retiro$arvore), FUN=sum)

dap.total.chauas <- as.numeric(dap.total.chauas$x)
h.total.chauas <- as.numeric(h.total.chauas$x)
dap.total.jureia <- as.numeric(dap.total.jureia$x)
h.total.jureia <- as.numeric(h.total.jureia$x)
dap.total.retiro <- as.numeric(dap.total.retiro$x)
h.total.retiro <- as.numeric(h.total.retiro$x)

par(mfrow=c(1,3))
plot(dap.total.chauas ~ h.total.chauas, xlab= "", ylab="T.cassinoides-h.arvore", main= "Chauas", col="black", cex=1, pch=16)
plot(dap.total.jureia ~ h.total.jureia, xlab= "T.cassinoides-dap.arvore", ylab="", main= "Jureia", col="red", cex=1, pch=17)
plot(dap.total.retiro ~ h.total.retiro, xlab= "", ylab="", main= "Retiro", col="green", cex=1, pch=18)

#4.5.2
par(mfrow=c(1,3))
scatter.smooth(dap.total.chauas ~ h.total.chauas, xlab= "", ylab="T.cassinoides-h.arvore", main= "Chauas", col="black", pch=16)
scatter.smooth(dap.total.jureia ~ h.total.jureia, xlab= "T.cassinoides-dap.arvore", ylab="", main= "Jureia", col="red", pch=17)
scatter.smooth(dap.total.retiro ~ h.total.retiro, xlab= "", ylab="", main= "Retiro", col="green", pch=18)

#4.5.3
require(lattice)
xyplot(dap.total.chauas ~ h.total.chauas, xlab= "T.cassinoides-dap.arvore", ylab="T.cassinoides-h.arvore", main= "Chauas", col="black", cex=1, pch=16)
xyplot(dap.total.jureia ~ h.total.jureia, xlab= "T.cassinoides-dap.arvore", ylab="T.cassinoides-h.arvore", main= "Jureia", col="red", cex=1, pch=17)
xyplot(dap.total.retiro ~ h.total.retiro, xlab= "T.cassinoides-dap.arvore", ylab="T.cassinoides-h.arvore", main= "Retiro", col="green", cex=1, pch=18)

##Existe uma relao positiva entre a altura da rvore e o dap para a espcie Tabebuia cassinoides em todos os caixetais.

